55 research outputs found

    Crowdsensed Mobile Data Analytics

    Get PDF
    Mobile devices, especially smartphones, are nowadays an essential part of everyday life. They are used worldwide and across all the demographic groups - they can be utilized for multiple functionalities, including but not limited to communications, game playing, social interactions, maps and navigation, leisure, work, and education. With a large on-device sensor base, mobile devices provide a rich source of data. Understanding how these devices are used help us also to increase the knowledge of people's everyday habits, needs, and rituals. Data collection and analysis can thus be utilized in different recommendation and feedback systems that further increase usage experience of the smart devices. Crowdsensed computing describes a paradigm where multiple autonomous devices are used together to collect large-scale data. In the case of smartphones, this kind of data can include running and installed applications, different system settings, such as network connection and screen brightness, and various subsystem variables, such as CPU and memory usage. In addition to the autonomous data collection, user questionnaires can be used to provide a wider view to the user community. To understand smartphone usage as a whole, different procedures are needed for cleaning missing and misleading values and preprocessing information from various sets of variables. Analyzing large-scale data sets - rising in size to terabytes - requires understanding of different Big Data management tools, distributed computing environments, and efficient algorithms to perform suitable data analysis and machine learning tasks. Together, these procedures and methodologies aim to provide actionable feedback, such as recommendations and visualizations, for the benefit of smartphone users, researchers, and application development. This thesis provides an approach to a large-scale crowdsensed mobile analytics. First, this thesis describes procedures for cleaning and preprocessing mobile data collected from real-life conditions, such as current system settings and running applications. It shows how interdependencies between different data items are important to consider when analyzing the smartphone system state as a whole. Second, this thesis provides suitable distributed machine learning and statistical analysis methods for analyzing large-scale mobile data. The algorithms, such as the decision tree-based classification and recommendation system, and information analysis methods presented in this thesis, are implemented in the distributed cloud-computing environment Apache Spark. Third, this thesis provides approaches to generate actionable feedback, such as energy consumption and application recommendations, which can be utilized in the mobile devices themselves or when understanding large crowds of smartphone users. The application areas especially covered in this thesis are smartphone energy consumption analysis in the case of system settings and subsystem variables, trend-based application recommendation system, and analysis of demographic, geographic, and cultural factors in smartphone usage.Erilaiset älylaitteet, erityisesti älypuhelimet, ovat muodostuneet oleelliseksi osaksi arkipäivän elektroniikan käyttöä. Älypuhelinten käyttö ei rajoitu perinteisiin kommunikaatiotoimintoihin, vaan niillä on voitu korvata monia muita laitteita ja palveluita, kuten pelit, kartat, sosiaalinen media, ja monet Internetin kautta saavutettavat palvelut. Koska laitteita on saatavilla monissa eri hintaluokissa, ne ovat pääsääntöisesti lähes kaikkien saatavilla, myös maailmanlaajuisesti. Aina mukana kannettavan älypuhelimen käyttö tuottaa runsaasti henkilökohtaista tietoa, mikä tarjoaa mahdollisuuden analysoida käyttäjien päivittäistä elämää. Henkilökohtaisia suosituksia hyödyntäen käyttäjille voidaan tarjota tietoa, joka auttaa parantamaan käyttäjäkokemusta ja laajentamaan älylaitteen käyttömahdollisuuksia. Joukkoistava havainnointi tarkoittaa tiedonkeräysmenetelmää, jossa useat erilliset laitteet osallistuvat automaattisesti suuremman datajoukon kartuttamiseen. Puhelinlaitteista tällaista kerättävää dataa ovat muun muassa tieto suorituksessa olevista ja asennetuista sovelluksista, erilaiset järjestelmäasetukset, kuten verkkoyhteystiedot ja näytön kirkkaus, sekä lukuisat muut järjestelmätason parametrit, kuten suorittimen ja muistin käyttö. Automaattista datan keräystä voidaan täydentää käyttäjille lähetettävillä kyselyillä. Älypuhelimista kerättävän datan analysoinnissa on monia vaiheita, jotka tekevät koko prosessista haasteellisen. Automaattisesti kerättyyn dataan päätyy helposti virheitä ja puutteita, joiden käsittely on hallittava. Datan määrä kasvaa helposti teratavuluokkaan, jolloin analysointiin tarvitaan suurten datajoukkojen käsittelyyn sopivia hajautettuja laskenta-alustoja ja algoritmeja. Hyödyllisten suositusten generoimiseksi puhelinlaitteisiin liittyvän analyysin halutaan usein olevan reaaliaikaista, mikä asettaa lisää haasteita analyysin suorituskyvylle. Tässä väitöskirjassa esitetään menetelmiä joukkoistetusti havainnoidun älypuhelindatan käsittelemiseksi tehokkaasti ja hyödyllistä informaatiota tuottaen. Väitöskirjan alussa kuvaillaan älypuhelindatan keräämistä prosessina, datan esikäsittelyä ja siistimistä hyödylliseen ja käsiteltävään muotoon. Väitöskirja esittää, että puhelinlaitteen tila tulisi ottaa huomioon kokonaisuutena, jossa useat eri tekijät, kuten samanaikaisesti suoritettavat sovellukset ja toisiinsa liittyvät järjestelmäasetukset vaikuttavat toisiinsa. Tämän jälkeen väitöskirjassa esitetään joitakin sopivia tilastollisen analyysin ja koneoppimisen menetelmiä, joita väitöskirjan tutkimuksessa on käytetty älypuhelindatan analysointiin. Kaikki näistä menetelmistä ovat suoritettavissa hajautetussa laskentaympäristössä ja toteutettu Apache Spark -järjestelmää käyttäen. Lopuksi väitöskirja näyttää, kuinka analyysiä sovelletaan käytännössä käyttäjille suunnatun palautteen ja suositusten generointiin. Päähuomion saavat puhelinlaitteiden energiankulutuksen analysointi, puhelinsovellusten trendien havainnointi, ja erilaisten kulttuuristen ja sosioekonomisten taustatekijöiden huomiointi mobiilikäyttöä tutkittaessa

    An approach to Machine Learning with Big Data

    Get PDF
    Cloud computing offers important resources, performance, and services nowadays when it has became popular to collect, store and analyze large data sets. This thesis builds on Berkeley Data Analysis Stack (BDAS) as a cloud computing environment designed for Big Data handling and analysis. Especially two parts of the BDAS, the cluster resource manager Mesos and the distribution manager Spark will be introduced. They offer important features, such as efficiency, multi-tenancy, and fault tolerance, for cloud computing. The Spark system expands MapReduce, the well-known cloud computing paradigm. Machine learning algorithms can predict trends and anomalies of large data sets. This thesis will present one of them, a distributed decision tree algorithm, implemented on the Spark system. As an example case, the decision tree will be used on the versatile energy consumption data from mobile devices, such as smart phones and tablets, of the Carat project. The data consists of information about the usage of the device, such as which applications have been running, network connections, battery temperatures, and screen brightness, for example. The decision tree aims to find chains of data features that might lead to energy consumption anomalies. Results of the analysis can be used to advise users on how to improve their battery life. This thesis will present selected analysis results together with advantages and disadvantages of the decision tree analysis

    Exploring the effects of below-freezing temperatures on smartphone usage

    Get PDF
    While the use of smartphones in extreme temperatures does not necessarily occur every day nor in all parts of the world, numerous use cases can be highlighted where the use of smartphones in cold temperatures is mandatory. Modern smartphones are designed to function in a wide range of temperatures, but when exposed to extreme cold temperatures the performance and reliability can significantly suffer. This paper presents a controlled laboratory experiment, using a clinical cold chamber to expose seven smartphone models to both medium cold (0 degrees C to -20 degrees C) and extreme cold (-30 degrees C) environments. The results showcase the smartphones' sensing software's lack of awareness of the cold environment, as well as reliability issues in the form of device crashes across the whole range of tested devices. We present a strategy for implementing monitoring application designs to both appropriately sense the effect of cold environments, as well as predicting device shutdowns in extreme cold. (C) 2021 The Authors. Published by Elsevier B.V.Peer reviewe

    Terveydenhuollon digitaalisten tietojärjestelmien vaikutus hoitohenkilöstöön ja potilastuloksiin: kartoittava kirjallisuuskatsaus hoitotyön näkökulmasta

    Get PDF
    Tämän kartoittavan kirjallisuuskatsauksen tarkoituksena oli koota tutkimusnäyttöä terveyspalveluiden digitaalisten tietojärjestelmien vaikuttavuudesta hoitohenkilöstöön ja potilastuloksiin. Sisäänottokriteerit olivat: tutkimus käsittelee terveydenhuollon digitaalista tietojärjestelmää, joka on käytössä kliinisessä työssä sekä sen vaikutusta hoidon laatuun, hoitohenkilöstön tai potilaiden tyytyväisyyteen, toiminnantehokkuuteen, hoidon tuloksiin, työn prosessiin tai hoidon kustannuksiin. Pois jätettiin viivakodin lukijat, johtamisen tietojärjestelmät ja mobiililaitteita käsittelevät tutkimukset, sekä tekoälyyn, herätteisiin, asioiden internetiin ja robotiikkaan pohjautuvat tutkimukset. Tiedonhaussa käytettiin neljää tietokantaa: CINAHL, Cochrane Library, PubMed ja Web of Science. Tuloksena löytyi 2400 artikkelia, joista 16 otettiin mukaan tutkimukseen. Artikkelit oli julkaistu vuosina 1995–2020. Tulokset analysoitiin deduktiivisella sisällönanalyysillä. Neljä tukimusta oli tehty kokeellisella asetelmalla ja 12 oli tehty kvasikokeellisella asetelmalla. Tutkimusten laatupisteet olivat keskinkertaisia. Tietojärjestelmistä käytetyt termit muodostivat yläkategoriat: Potilasasiakirja, lääkehoidon prosessi, tiedon automaattinen tallennus sekä potilasportaali. Suurin osa tutkimuksista keskittyi potilasasiakirjoihin. Järjestelmien päätehtäviä olivat lääkehoidon prosessin tukeminen ja digitaalinen hoitotyön kirjaus. Digitaalisia tietojärjestelmiä verrattiin paperisiin järjestelmiin ja dataa kerättiin kyselylomakkeilla tai aika- ja liikeanalyysin avulla. Hoitohenkilöstön tuloksiin liittyen tutkituimpia aiheita olivat ajankäyttö ja tyytyväisyys, joiden suhteen tulokset jäivät ristiriitaisiksi. Potilastulokset eivät tulleet aineistossa esiin laajasti. Neljässä potilastuloksia koskevassa tutkimuksessa havaittiin kuitenkin niin positiivisia kuin negatiivisia vaikutuksia.Tulosten perusteella voidaan todeta, että näyttö digitaalisen tietojärjestelmien vaikutuksesta henkilöstöön ja potilastuloksiin on vielä vähäistä ja digitaalisten tietojärjestelmien terminologia ja määritelmät ovat hajanaisia. Korkeatasoista näyttöä vaikuttavuudesta käytännön ympäristössä tarvitaan enemmän erityisesti siitä, miten tietojärjestelmät vaikuttavat potilastuloksiin.</p

    Exploiting Usage to Predict Instantaneous App Popularity : Trend Filters and Retention Rates

    Get PDF
    Popularity of mobile apps is traditionally measured by metrics such as the number of downloads, installations, or user ratings. A problem with these measures is that they reflect usage only indirectly. Indeed, retention rates, i.e., the number of days users continue to interact with an installed app, have been suggested to predict successful app lifecycles. We conduct the first independent and large-scale study of retention rates and usage trends on a dataset of app-usage data from a community of 339,842 users and more than 213,667 apps. Our analysis shows that, on average, applications lose 65% of their users in the first week, while very popular applications (top 100) lose only 35%. It also reveals, however, that many applications have more complex usage behaviour patterns due to seasonality, marketing, or other factors. To capture such effects, we develop a novel app-usage trend measure which provides instantaneous information about the popularity of an application. Analysis of our data using this trend filter shows that roughly 40% of all apps never gain more than a handful of users (Marginal apps). Less than 0.1% of the remaining 60% are constantly popular (Dominant apps), 1% have a quick drain of usage after an initial steep rise (Expired apps), and 6% continuously rise in popularity (Hot apps). From these, we can distinguish, for instance, trendsetters from copycat apps. We conclude by demonstrating that usage behaviour trend information can be used to develop better mobile app recommendations.Peer reviewe

    When phones get personal : Predicting Big Five personality traits from application usage

    Get PDF
    As smartphones are increasingly an integral part of daily life, recent literature suggests a deeper relationship between personality traits and smartphone usage. However, this relationship depends on many complex factors such as geographic location, demographics, or cultural influence, just to name a few. These factors provide crucial knowledge for e.g. usage support, recommendations, marketing, general usage improvements. We use six months of application usage data from 739 Android smartphone user together with the IPIP 50-item Big Five personality traits questionnaire. As our main contribution, we show that even category-level aggregated application usage can predict Big Five traits at up to 86%-96% prediction fit in our sample. Our results show the effect of personality traits on application usage (mean error improvement on random guess 17.0%). We also identify which application usage data best describe the Big Five personality traits. Our work enables future personality-driven research, and shows that when studying personality, application categories can provide sufficient predictions in general traits. (C) 2020 The Authors. Published by Elsevier B.V.Peer reviewe

    Predicting Depression From Smartphone Behavioral Markers Using Machine Learning Methods, Hyperparameter Optimization, and Feature Importance Analysis : Exploratory Study

    Get PDF
    Background: Depression is a prevalent mental health challenge. Current depression assessment methods using self-reported and clinician-administered questionnaires have limitations. Instrumenting smartphones to passively and continuously collect moment-by-moment data sets to quantify human behaviors has the potential to augment current depression assessment methods for early diagnosis, scalable, and longitudinal monitoring of depression. Objective: The objective of this study was to investigate the feasibility of predicting depression with human behaviors quantified from smartphone data sets, and to identify behaviors that can influence depression. Methods: Smartphone data sets and self-reported 8-item Patient Health Questionnaire (PHQ-8) depression assessments were collected from 629 participants in an exploratory longitudinal study over an average of 22.1 days (SD 17.90; range 8-86). We quantified 22 regularity, entropy, and SD behavioral markers from the smartphone data. We explored the relationship between the behavioral features and depression using correlation and bivariate linear mixed models (LMMs). We leveraged 5 supervised machine learning (ML) algorithms with hyperparameter optimization, nested cross-validation, and imbalanced data handling to predict depression. Finally, with the permutation importance method, we identified influential behavioral markers in predicting depression. Results: Of the 629 participants from at least 56 countries, 69 (10.97%) were females, 546 (86.8%) were males, and 14 (2.2%) were nonbinary. Participants' age distribution is as follows: 73/629 (11.6%) were aged between 18 and 24, 204/629 (32.4%) were aged between 25 and 34, 156/629 (24.8%) were aged between 35 and 44, 166/629 (26.4%) were aged between 45 and 64, and 30/629 (4.8%) were aged 65 years and over. Of the 1374 PHQ-8 assessments, 1143 (83.19%) responses were nondepressed scores (PHQ-8 score = 10), as identified based on PHQ-8 cut-off. A significant positive Pearson correlation was found between screen status-normalized entropy and depression (r=0.14, P Conclusions: Our findings demonstrate that behavioral markers indicative of depression can be unobtrusively identified from smartphone sensors' data. Traditional assessment of depression can be augmented with behavioral markers from smartphones for depression diagnosis and monitoring.Peer reviewe

    6G White Paper on Edge Intelligence

    Get PDF
    In this white paper we provide a vision for 6G Edge Intelligence. Moving towards 5G and beyond the future 6G networks, intelligent solutions utilizing data-driven machine learning and artificial intelligence become crucial for several real-world applications including but not limited to, more efficient manufacturing, novel personal smart device environments and experiences, urban computing and autonomous traffic settings. We present edge computing along with other 6G enablers as a key component to establish the future 2030 intelligent Internet technologies as shown in this series of 6G White Papers. In this white paper, we focus in the domains of edge computing infrastructure and platforms, data and edge network management, software development for edge, and real-time and distributed training of ML/AI algorithms, along with security, privacy, pricing, and end-user aspects. We discuss the key enablers and challenges and identify the key research questions for the development of the Intelligent Edge services. As a main outcome of this white paper, we envision a transition from Internet of Things to Intelligent Internet of Intelligent Things and provide a roadmap for development of 6G Intelligent Edge
    corecore